Online problémy v strojovom učení
نویسنده
چکیده
Online strojové učenie je matematický model, kde agent robí predpovede zároveň s tým ako prijíma dáta. Kl’účovým faktorom je rýchlost’ konvergencie agenta k optimálnemu offline riešeniu. Zrekapitulujem niekol’ko klasických problémov: učenie sa s pomocou expertov, problém mnohorukého banditu. Načrtnem súvislosti s inými oblast’ami aplikovanej matematiky: gradientné metódy z optimalizácie, opakované hry a kompetitívna analýza online algoritmov. V druhej časti sa budem zaoberat’ opakovanými hrami s neúplnou informáciou, čo je zovšeobecnenie predchádzajúcich modelov. Pred dvoma rokmi sme ja, András Antos, Gábor Bartok, Dean Foster, Alexander Rakhlin, a Csaba Szepesvari klasifikovali všetky konečné opakované hry s neúplnou informáciou podl’a minimax rýchlosti ich konvergencie. Vysvetlím štruktúru rôznych typov hier tejto klasifikácie.
منابع مشابه
Možnosti Vývoje Inteligence
je základem pro pokrok v učení a vývoj různých dovedností, zároveň umožňuje
متن کاملLearning by Bidding: Evidence from a Large-scale Natural Experiment
Learning is a subject of intense research in experimental economics. We contribute to this debate by presenting persuasive evidence that learning took place among uninformed heterogeneous agents on a quasi-stock market during a large-scale natural experiment that by size, incentives, and variation belongs among the largest experiments ever conducted. To detect and quantify learning we develop n...
متن کاملAlternatívy k MILP pre rozvrhovanie dávkových banských procesov
Alternatívy k MILP pre rozvrhovanie dávkových banských procesov Cieľom príspevku je navrhnúť možnosť, nahradenia optimalizačných metód na báze zmiešaného celočíselného programovania použitím približných metód rozhodovania (heuristika) v oblasti plánovania a riadenia banských procesov. Výsledkom tohto počítačom podporaovaného plánovania sú detailné výrobné rozvrhy vytvorené podľa požiadaviek ako...
متن کاملMı́ry a lineárnı́ maticové nerovnosti v optimálnı́m polynomiálnı́m řı́zenı́ Measures and linear matrix inequalities in polynomial optimal control Summary
Míry a lineární maticové nerovnosti v optimálním polynomiálnímřízení Measures and linear matrix inequalities in polynomial optimal control Summary This lecture describes the application of modern techniques of convex optimization to solve nonconvex nonlinear optimal control problems (OCPs) which may feature oscillation phenomena (chattering control) or concentration phenomena (impulsive control...
متن کاملHybridization of Evolutionary Algorithms Using Different Evaluation Approaches
Tato práce je zaměřena na výzkum evolučních algoritmů kombinujícíh moderní přístup v evolučním počítání, zvaný novelty search, s klasickým přístupem založeným na optimalizaci fitness. Novelty search je v této práci analyzován spolu s jedním dosavadním přístupem který již novelty search a fitness kombinuje a jsou zmíněny jejich výhody a nevýhody. Na základě této analýzy jsou navrhnuty dva nové h...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2013